Math Sci Life Code Log in

Mathematics

Learn Mathematical principles behind our physical world

Updated at 2021.4.14 Updated at 2019.05.05 Updated at 2015.01.18

이항분포와 정규분포

앞글의 동전 던지기 놀이를 통해 이항분포에 대해 알아보았다. 시행횟수가 많아지면 이항분포가 정규분포와 같아지는 것을 수학적으로 엄밀하게 유도해 보자. 이번에 대수의 성질에 대해 간단히 생각할 기회를 갖고, 통계 역학의 기본을 다져보자.

앞서 동전 던지기를 많이 반복하면 정규분포로 근사할 수 있다고 했는데, 진짜 그럴까? 남이나 책에서 그렇다고 해서 무조건 받아들이면 안된다. 정규분포에 대해서 배우긴 했지만 왜 그런 복잡한 수식이 나왔는지에 대해서는 그냥 그런가 했다. 1733년에 아브라함 드무아브르가 시행회수(N)가 클 때의 이항분포의 근사치를 계산하기 위해 유도하였다고 한다.

이항분포

특정 사건이 일어날 확률이 \(p\), 일어나지 않을 확률이 \(q\) 라 할 때, \(N\) 번 시행하여 그 사건이 \(r\) 번 일어날 확률은 다음과 같다.

\begin{align}P(r) =\frac{N!}{r!(N-r)!}{p^r}{q^{N-r}}\end{align}

정규분포로의 근사

\(N\) 이 매우 커지면 이 확률 분포의 변수인 \(r\) 은 연속값으로 생각할 수 있고, 최대값을 갖는 \(r\)\(k\) 이라고 하면,

\begin{align}\left ( \frac{\partial P(r)}{\partial r}\right )_{r=k} = 0\end{align}

log함수는 단조증가 함수이므로 로그를 취한 뒤에 미분을 해도 동일한 수식을 만족한다.

\begin{align}\left ( \frac{\partial \ln P(r)}{\partial r}\right )_{r=k} = 0\end{align}

1차 미분값 구하기

위의 수식(1)의 양변에 \(ln\) 을 취하면

\begin{align}\begin{split}\ln P(r) &= \ln N! - \ln r! - \ln (N-r)! \\ &+ r \ln p + (N-r) \ln q\end{split}\end{align}

이고, 스털링 근사를 적용하면 아래와 같다.

\begin{align}\begin{split}\ln P(r) &= \ln N! - r \ln r - (N-r) \ln (N-r) \\ &+ r \ln p + (N-r) \ln q \end{split}\end{align}

위의 수식을 \(r\) 에 대해 미분하면,

\begin{align}\frac{\partial \ln P}{\partial r} = -\ln r + \ln (N-r) + \ln p - \ln q\end{align}

상기 수식에서 \(r = k\) 일때 0이므로

\begin{align}-\ln k + \ln (N-k) + \ln p - \ln q = 0\end{align}

정리하면

\begin{align}k = Np\end{align}

즉 이항분포의 평균값 \(m = Np\) 일 때 최대값을 갖는것을 알 수 있다.

2차 미분값 구하기

이제 로그를 취한 \(P(r)\)\(r=k\) 일 때 테일러 급수 전개를 해보자.

\begin{align}\begin{split}\ln P(r) &= \ln P(k) + \left (\frac{\partial \ln P}{\partial r} \right )_k (r-k) \\ &+ \frac{1}{2} \left (\frac{\partial^2 \ln P}{\partial r^2} \right )_k (r-k)^2 + \cdots\end{split}\end{align}

\(r = k\) 일 때 1차 미분은 0이고(위에서 유도함), 2차 미분을 구해보면,

\begin{align}\frac{\partial^2 \ln P}{\partial r^2} = -\frac {1}{r} - \frac {1}{N-r}\end{align}

\(r=k\) 일 때 정리하고, 이항분포의 분산이 \(Npq\) 이므로

\begin{align}\left (\frac{\partial^2 \ln P}{\partial r^2} \right )_k &= -\frac {1}{k} - \frac {1}{N-k} \\ &= -\frac {1}{Np} - \frac {1}{N-Np} \\ &= -\frac {1}{Npq} \\ &= -\frac {1}{\sigma^2}\end{align}

근사값 구하기

따라서 테일러 급수로 전개한 수식을 2차항까지만으로 근사하면 다음과 같다.

\begin{align}\ln P(r) = \ln P(m) - \frac{1}{2} \left (\frac{r-m}{\sigma} \right )^2\end{align}

로그를 제거하면,

\begin{align}P(r) = P(m) e^{-\frac{(r-m)^2}{2\sigma^2}}\end{align}

모든 r에 대해서 위의 함수값을 더하면 1일 되도록 하여 \(P(m)\) 을 구하면, 즉 표준화 시켜 확률밀도 함수를 구할 수 있고 이 함수를 표준정규분포라고 한다.

\begin{align}\red{P(r) = \frac{1}{\sqrt{2\pi}\sigma} e^{-\frac{(r-m)^2}{2\sigma^2}}}\end{align}

마지막으로 좀 단순화하여 표현하면, \(B(N,p)\)\(N\) 이 충분히 크면 \(Z(Np, Npq)\) 로 나타낼 수 있다. B는 이항분포, Z는 표준정규분포, 정규분포의 평균은 \(Np\) 이고 분산은 \(Npq\) 이다 (이에 대한 증명은 생략).


21 개의 글이 있습니다.

# 제목 날짜 조회수
01 이항분포와 정규분포 2021/04/28 153
02 푸리에 급수 2021/04/28 333
03 해석적 확장과 감마 함수 2021/05/25 113
04 푸리에 변환 2021/05/25 269
05 수학적 증명 방법 2021/05/25 144
06 원주율 구하기 2021/04/22 142
07 자연상수의 무리수 증명 2021/05/25 122
08 스털링 근사 2021/05/25 174
09 선형변환 2021/04/29 146
10 자연상수와 지수함수 2021/04/22 136
11 동전 던지기와 확률 이야기 2021/04/28 142
12 수학 분야 2021/04/28 167
13 지수함수의 확장 2021/04/28 133
14 제타함수 2021/05/25 138
15 꼭 알아야 할 수학 기호 2021/04/28 125
16 정사영과 직교 2021/04/29 133
17 소수의 개수 2021/05/25 168
18 수의 기하학적 의미 2021/04/28 123
19 허수 2021/04/22 144
20 테일러 급수 2021/05/25 162
21 Fast Fourier Transform 2021/04/28 154

Most Popular #3

Recent #3

An error has occurred. This application may no longer respond until reloaded. Reload 🗙